我们解决了预测动态场景视频的显着图的问题。我们注意到,从固定数量的观察者的凝视数据重建的地图的准确性随帧而变化,因为它取决于场景的内容。当有有限数量的观察者可用时,此问题尤其如此紧迫。在这种情况下,随着传统的深度学习方法,直接最大限度地减少预测和测量的显着性图之间的差异,导致对嘈杂数据过度接受。我们提出了一种噪声感知培训(NAT)范式,这些培训量量化和占帧特异性凝视数据不准确的不确定性。我们表明NAT在有限的培训数据可用时特别有利,在不同模型,丢失函数和数据集中有实验。我们还引入了基于视频游戏的显着数据集,具有富有的时间语义,每帧多个凝视吸引子。数据集和源代码可在https://github.com/nvlabs/nattacy上获得。
translated by 谷歌翻译
这项工作提出了一个基于注意力的序列到序列模型,用于手写单词识别,并探讨了用于HTR系统数据有效培训的转移学习。为了克服培训数据稀缺性,这项工作利用了在场景文本图像上预先训练的模型,作为调整手写识别模型的起点。Resnet特征提取和基于双向LSTM的序列建模阶段一起形成编码器。预测阶段由解码器和基于内容的注意机制组成。拟议的端到端HTR系统的有效性已在新型的多作用数据集IMGUR5K和IAM数据集上进行了经验评估。实验结果评估了HTR框架的性能,并通过对误差案例的深入分析进一步支持。源代码和预培训模型可在https://github.com/dmitrijsk/attentionhtr上找到。
translated by 谷歌翻译
使用模块化和可重新配置性方面的操纵器配置的自定义是受到大量关注的。到目前为止展示了常规和标准配置的模块。本文介绍了3D可打印,轻量级和非传统模块:Moirs'Mark-2,即使具有非平行和非垂直的连接配置,也可以开发任何自定义`的自由度(DOF)串行机械手。模块化配置的这些非常规设计为模块化组件和软件界面寻求易于适应的解决方案,用于自动建模和控制。使用所提出的4个模块单元,在本文中提出了组装模块,模块化和可重新配置机械手的模块和可重新配置机械手的模块,自动和统一建模。提供可重新配置的软件架构,用于自动生成运动和动态模型和配置文件,通过该设计文件,设计器可以根据需要设计,使用可视化,计划和执行开发配置的运动。开发的框架基于一个称为机器人操作系统(ROS)的开源平台,其充当模块化配置的数字双胞胎。对于实验演示,开发了一个3D印刷模块化库,并使用所提出的模块随后进行了非传统配置,用于自动建模和控制,用于垂直农场设置的单个单元格。
translated by 谷歌翻译
模块化和可重新配置的机器人系统旨在为在受限环境中执行的非重复任务提供定制解决方案。定制解决方案通常从可能的机械手配置的基于任务的优化提取,但不整合解决方案,用于直接提供模块化组成。在这项工作中,在第一阶段,基于规定的工作位置和杂乱的环境,讨论了以最小程度的自由度找到非常规优化配置的策略。然后,在第二阶段,介绍了模块化和可重新配置架构的设计,其可以适应这些非传统的机器人参数。而不是产生和发展模块化组合物,呈现了一种策略,通过该策略通过该策略通过该策略可以直接映射到模块化组合物。使用机器人操作系统验证产生的模块化组合物,用于在给定的杂乱环境中规定的工作位置之间的运动规划。
translated by 谷歌翻译